【重磅】Facebook物体检测平台宣布开源! Mask R-CNN源代码终于来了!
导读
Detectron是Facebook的物体检测平台,今天宣布开源,它基于Caffe2,用Python写成,这次开放的代码中包含了Mask R-CNN的实现。除此之外,Detectron还包含了ICCV 2017最佳学生论文RetinaNet,Ross Girshick(RBG)此前的研究Faster R-CNN和RPN、Fast R-CNN、以及R-FCN的实现。
来源/量子位
文章仅代表作者本人观点,如来源标注有误,我们及时予以更正/删除
Mask R -CNN在2017年初提出后,一直受到极大关注。围绕它的讨论,最终都终结于一句话:等代码吧!
今天,Facebook宣布开源物体检测平台Detectron,它基于Caffe2,用Python写成,这次开放的代码中就包含了Mask R-CNN的实现。
除此之外,Detectron还包含了ICCV 2017最佳学生论文RetinaNet,Ross Girshick(RBG)此前的研究Faster R-CNN和RPN、Fast R-CNN、以及R-FCN的实现。
Detectron的基干(backbone)网络架构包括ResNeXt{50,101,152}、ResNet{50,101,152}、FPN和VGG16。
同时,Facebook还发布了70多种ImageNet-1k预训练模型的性能基准,包括用用1、2块GPU时,上述各种基干架构和检测算法相结合做区域建议、遮罩检测以及人体关键点检测的训练时间、推理时间等。
要使用Detectron,你需要先配置英伟达GPU(是的,它还不支持CPU)、Linux系统和Python2,还要安装Caffe2和COCO API。然后,三步装上Detectron:
Clone Detectron:
设置Python模块:
检查Detectron的测试通过:
这样,就足够用预训练模型做推理了。
如果要用Detectron来训练自己的检测模型,就需要先确保能通过符号链接lib/datasets/data找到数据集,然后用CMake创建定制的运算符库:
并检查这些运算符的测试通过:
Facebook还贴心地写了份上手教程,教你用预训练的Mask R-CNN来做物体检测。
如果要在本地图像上运行,只需要使用infer_simple.py工具,运行:
就能得到如下图所示的输出。
如果要在COCO数据集上做推理,需要运行:
上面这个例子,用了端到端预训练的Mask R-CNN,在一块GPU上运行。如果要使用多个GPU,需要在第二行之后添加 —multi-gpu-testing \ 并更改最后的NUM_GPUS数量。
截至记者发稿,Detectron在GitHub上放出7小时,已经收获738颗星标、101次Fork。
RBG在Facebook上发帖介绍说,这个项目2016年7月启动,想要基于Caffe 2构建一个快速、灵活的物体检测系统,至今已经一年半的时间。Detectron系统本来是Facebook内部使用的,我们前面提到的Mask R-CNN和RetinaNet背后,都由Detectron提供支持。
除了RBG之外,Ilija Radosavovic、Georgia Gkioxari、Piotr Dollar和何恺明也参与了Detectron项目。
在Facebook内部,Detectron不仅用于研究,还用来为增强现实、商业诚信等方面的应用训练定制化的模型。这些模型训练完成后可以部署在云端或者移动设备上,由Caffe2运行时提供支持。
RBG说,Facebook将Detectron平台开源出来,是想要加速世界各地实验室的研究,推动物体检测的进展。
Now go forth and create algorithms to detect all of the things!
想用Detectron搞物体检测算法,你可能要用到下面这些链接:
Detectron开源代码:
https://github.com/facebookresearch/Detectron
相关物体检测论文:
Mask R-CNN
https://arxiv.org/abs/1703.06870
RetinaNet
https://arxiv.org/abs/1708.02002
Faster R-CNN和RPN
https://arxiv.org/abs/1506.01497
Fast R-CNN
https://arxiv.org/abs/1504.08083
R-FCN
https://arxiv.org/abs/1605.06409
性能基准和Model ZOO:
https://github.com/facebookresearch/Detectron/blob/master/MODEL_ZOO.md
另外,你们可能还想去RBG大神的FB帖子底下表达一波感谢(以及质问开源代码为何拖了这么久):
https://www.facebook.com/ross.girshick/posts/10159910213745261
Have fun~
推荐阅读
【深度】张钹院士谈模式识别面临的挑战:离人工智能的目标相距甚远,大家不要太乐观
我们是一家技术服务公司,汇集⼈⼯智能领域的智库资源,为各级政府和企业提供科技信息咨询、技术孵化、技术对接、⼈⼯智能技术培训、科技交流等服务。欢迎与我们联系,将您对技术的需求告诉我们。